sparklyr.sedona: A sparklyr extension for analyzing geospatial data
我们很高兴地宣布 sparklyr.sedona 现已推出,这是一个 sparklyr 扩展,可让 Apache Sedona 库的地理空间功能从 R 轻松访问。
Sparklyr 1.7 提供了备受期待的改进,包括用于图像和二进制数据源的 R 接口、几个新的 spark_apply() 功能以及与 sparklyr 扩展的更好集成。
Que haja luz: More light for torch!
今天,我们介绍 luz,它是 torch 的高级接口,可让您以简洁、声明式的风格训练神经网络。从某种意义上说,它之于 torch 就像 Keras 之于 TensorFlow:它既提供了简化的工作流程,也提供了强大的自定义方式。
sparklyr 1.6: weighted quantile summaries, power iteration clustering, spark_write_rds(), and more
sparklyr 1.6 版本引入了加权分位数摘要、用于支持迭代聚类的 R 接口、spark_write_rds(),以及许多与 dplyr 相关的改进。
torch time series, final episode: Attention
我们通过使用一种在自然语言处理中非常流行且受人类(和动物)认知启发的技术来增强上次的序列到序列架构,从而结束使用 torch 进行时间序列预测的迷你系列:注意力。
torch time series, take three: Sequence-to-sequence prediction
在我们对时间序列预测技术的概述中,我们转向序列到序列模型。该系列中的架构通常用于自然语言处理 (NLP) 任务,例如机器翻译。然而,对于 NLP,在进行模型定义和训练之前需要进行大量的预处理。在熟悉的数值序列中,我们可以完全专注于概念。
torch time series continued: A first go at multi-step prediction
我们继续探索使用 torch 进行时间序列预测,转向为多步预测设计的架构。在这里,我们通过多层感知器 (MLP) 增强了“主力 RNN”,以推断未来的多个时间步。
Introductory time-series forecasting with torch
这篇文章介绍了使用 torch 进行时间序列预测。核心主题是数据输入和 RNN(GRU/LSTM)的实际使用。即将发布的文章将以此为基础,并介绍越来越复杂的架构。
First mlverse survey results – software, applications, and beyond
上个月,我们对 mlverse 软件进行了首次调查,涵盖的主题包括从应用领域到软件使用,再到用户的愿望和建议。此外,调查还询问了对 AI/ML 社会影响的看法。这篇文章介绍了调查结果,并试图解决一些出现的问题。
torch, tidymodels, and high-energy physics
今天我们介绍 tabnet,这是“TabNet:专注可解释表格学习”的 torch 实现,与 tidymodels 框架完全集成。从本质上讲,tabnet 的设计只需要很少的数据预处理;多亏了 tidymodels,超参数调整(在深度学习中通常很麻烦)变得方便甚至有趣!
Simple audio classification with torch
本文将 Daniel Falbel 关于“简单音频分类”的文章从 TensorFlow/Keras 翻译成 torch/torchaudio。
Forecasting El Niño-Southern Oscillation (ENSO)
厄尔尼诺-南方涛动 (ENSO) 是一种大气现象,位于热带太平洋,极大地影响着全球大部分地区的生态系统和人类福祉。我们使用之前文章中介绍的 convLSTM 从空间有序的海面温度序列预测 Niño 3.4 指数。
Convolutional LSTM for spatial forecasting
在预测空间确定的现象(例如天气或电影中的下一帧)时,我们希望对时间演变进行建模,理想情况下使用递归关系。同时,我们希望有效地提取空间特征,这通常是使用卷积滤波器完成的。理想情况下,我们将拥有一个既是循环又是卷积的架构。在这篇文章中,我们使用 torch 构建了一个卷积 LSTM。
torch 0.2.0 - Initial JIT support and many bug fixes
torch 0.2.0 版本包含许多错误修复和一些不错的新功能,如初始 JIT 支持、多工作器数据加载器、新优化器和 nn_modules 的新打印方法。
sparklyr 1.5: better dplyr interface, more sdf_* functions, and RDS-based serialization routines
与之前的所有三个 sparklyr 版本不同,最近发布的 sparklyr 1.5 更注重增强现有的 sparklyr 功能,而不是创建新功能。因此,我们采纳了许多来自 sparklyr 用户的宝贵建议,并在一系列错误修复和改进中成功解决了这些问题。
Brain image segmentation with torch
各种科学及其应用都需要对图像进行分割,其中许多对人类(和动物)生命至关重要。在这篇介绍性文章中,我们训练了一个 U-Net 来标记 MRI 脑部扫描中的病变区域。